5月30日,多模态大模型产业高峰论坛在北京举行。近百位专家学者、行业大咖和产业精英齐聚一堂,共同探讨多模态大模型的产业机遇和未来发展。论坛上,多模态对话应用的全新升级版本元乘象ChatImg2.0、Multi- -s Maas 大模型运营平台软通天璇2.0重磅发布,同时,进行了多项产业合作签约,共同推动多模态大模型产业落地。
中国科学院院士、国家纳米科学中心主任、广东粤港澳大湾区国家纳米科技创新研究院院长赵宇亮,中国软件行业协会副秘书长杨菊,中国人民大学教授、软通动力首席AI 科学家卢志武,智子引擎CEO高一钊,福州市电信息集团总工、计算中心负责人陈爽,华为昇腾生态发展部总监王震军,软通智慧首席运营官李进和软通动力董事长兼首席执行官刘天文等出席本次论坛。
2023年是AI大模型全面爆发的元年,国内外AI大模型技术在加速更新迭代,产业需求不断增加。其中,多模态大模型作为最前沿的AI技术,有着广泛的应用前景。如何将多模态大模型与产业相结合、与具体应用场景相结合,成为多方关注的重要课题。
中国科学院院士、国家纳米科学中心主任、广东粤港澳大湾区国家纳米科技创新研究院院长赵宇亮致开场词。他表示,科技创新链划分为九个发展级别,其中,1-3级为高校科研院所的实验室阶段,7-9级为产业化阶段,而4-6级的工程化阶段由于成果转化率低,成为很多企业卡脖子难题。所以,打造一个成果转移转化的平台成为当务之急。作为很多技术的底层支撑,数字技术、智能技术的发展也离不开纳米技术,希望担任桥梁角色与产业伙伴一起促进数智化转型,助力科技强国建设。
中国软件行业协会副秘书长杨菊在致辞中表示,作为人工智能领域最重要的技术之一,多模态大模型具有广泛的应用前景和巨大价值,将给很多行业带来革命性变化。充分发挥多模态大模型的潜力和价值,需要业界的共同努力,通过优势互补,构建一个开放协作的生态系统。
软通动力董事长兼首席执行官刘天文表示,如同21世纪初的互联网、21世纪10年代的移动互联网一样,AIGC产业将是时代发展的下一个重要机遇。在数字经济蓬勃发展的浪潮下,AIGC的发展将为企业应对成本挑战、提升效率带来全面的赋能。
在论坛上,大模型ChatImg2.0惊艳亮相。元乘象ChatImg0 2.0 的发布是本次论坛的重头戏,作为全球首个多模态对话应用,3月份ChatImg发布时就在行业引发热烈反响,ChatImg2.0在多方面进行了优化。根据多模态对话数据集(LLaVa)的公开评测,ChatImg2.0的中文和英文多模态对话能力均表现不俗。
智子引擎CEO高一钊在分享中介绍了ChatImg发展历程,并重点解读了ChatImg2.0的新功能,包括新增语音交互、支持视频输入,以及交互的优化升级等。根据展示,ChatImg2.0在图文对话和视频对话上均展现出了强大的效果。
纯文本对话效果方面,ChatImg2.0可以读懂多种多样的指令,例如扮演诗人、rapper、演说家等;而在图文对话实际效果方面,ChatImg2.0可以看懂非常丰富的图像内容。
值得一提的是,在视频对话实际效果方面,ChatImg2.0可以看懂视频并对内容作出推理。
据介绍,智子引擎的大模型元乘象在多模态大模型应用场景的探索上走在行业前列。比如,在城市社会治理领域的应用场景,元乘象ChatImg可以同时在许多复杂场景达到90%以上的准确率,显著超越了传统AI模型。由于从部署几百个小模型变成了部署一个大模型,整个系统的复杂度、部署代价都有显著的降低。还有,智子引擎团队联合北京理工大学张伟民教授团队共同打造了一款智能机器人小象,为ChatImg装上了身体。
高一钊表示,智子引擎的核心发展战略是打造一个通用的多模态AI生成模型,支持多模态输入、多模态输出。团队成员已经在文生图、文生视频、多模态融合搜索等多个领域取得成果,后期将全部整合进元乘象。
转载请注明出处